로블록스와 제페토 리뷰분석

개요

21세기 10대들이 즐긴다는 메타버스 게임

로블록스와 제페토에 대한 유저들의 평가를 분석해 보겠다.

리뷰 데이터는 구글플레이스토어에서 수집했다.


구성

데이터 스토리의 구성은 다음과 같다.

먼저 제페토 리뷰를 살펴본 뒤 로블록스를 진행하겠다.

  1. 유저들의 리뷰에서 단순 단어의 빈도를 살펴본다.

  2. 빈도로 보았을 때 의미가 없다고 판단 되는 단어를 불용어로 정의하고 무시하겠다.

  3. 별점 1점부터 5점까지 점수를 기준으로 단어의 빈도를 살펴본다.

  4. 빈도수가 많이 나온 단어와 유사한 단어를 알아본다.

  5. 유사한 단어를 거리로 표현해서 시각화 한다.

다음으로 로블록스의 리뷰도 살펴볼 건데 구성은 똑같기 때문에 생략하겠다.


목차

제페토

로블록스


제페토

깃발

먼저 제페토에 대한 리뷰를 보자.

리뷰, 별점, 공감 수, 버전정보, 리뷰 등록 일시, 답변, 답변 등록 일시로 구성되어있다.

ze_review_df.loc[:,ze_review_df.columns!='userName']

중복이 있을 수도 있으니 췍

print(f'제페토 리뷰 수 : {len(ze_review_df["content"])}')
print(f'중복된 리뷰를 제외한 리뷰 수 : {len(ze_review_df["content"].unique())}')

3465개의 중복을 제거해 주었다.

형태소 분석을 실시하기 전에

제대로 지키기 어려운 한글 맞춤법을

대신 맞춰 준다. (단, 500자 이상은 못해줌 ^^;)


형태소 분석

그리고 KoNLPy의 Okt 형태소 분석기를 사용해서

리뷰를 정규화하고 명사만 추출했다.

이런 식으로 문장을 보정해준다.

데이터프레임에 있는 리뷰들을 하나의 텍스트로 만들어서

명사만 추출했다.

그때의 출현 상위 10개 단어다.

제, 것 등... 큰 의미가 없는 단어는

삭제하는 것이 낫겠다.

특히 제페토 단어가 많이 나온 것은 지칭하기 위함으로 판단하고 삭제했다.

또, 젬을 잼으로 적거나 렉을 랙으로 적은 것들도 보정했다.

# 불용어 설정
stop_words = ['좀','제','것','거','때','이','정말','저','수','점','요','별','그','전','뭐','해','말','제페토','안',
              '분','번','게','내','해도','데','기','나','등','만','도','무','막','함','중','용','임','그거']

ze_text = ze_text.replace('랙','렉').replace('잼','젬')


보정을 마치면 빈도 수 상위 10개는 다음과 같다.

게임이라는 단어도 단순히 지칭하기 위함으로 생각할 수 있으나

제페토에는 다양한 미니게임이 존재하는 것을 알 수 있었는데,

미니게임에 대한 리뷰라고 생각하고 삭제하지 않았다.


점수별 단어 빈도


1점 리뷰와 5점리뷰의 개수가 가장 많다.

의사표현이 확실한 mz세대다.

1점 리뷰에는 틱톡, 진짜, 다시, 앱

5점 리뷰에는 친구, 코인, 더

등장 빈도가 높은 단어에 차이가 보인다


상위 10개 단어 연관단어

별점이 1점인 리뷰에 많이 나온 단어인

'진짜'는 부정적인 단어와 함께 있을 확률이 높았다

'앱' 단어가 별점 1점에서 빈도가 높았던 것으로보아

설치에 문제가 있거나 앱 실행 시 중단 현상이 있을 것으로 추측할 수 있다.

가까이 있는 단어 시각화

단어가 많아서 한눈에 알아 보기가 힘들다...

하지만 마우스를 올려 이리저리 왔다갔다 해보면

렉, 버퍼링, 튕김, 중지, 폰... 등 앱으로 실행했을 때의 문제점이 뭉쳐있고

바지, 입술, 눈썹, 체형... 등 캐릭터에 관한 것이 뭉쳐있는 것도 보인다.



로블록스

깃발

이번엔 로블록스에 대한 리뷰를 보자.

구성은 제페토와 같다.

형태소 분석

제페토와 동일하게 수집되었다.

역시 중복 체크

로블록스도 중복 갯수가 꽤 많다.

왜 중복 리뷰가 입력 됐을까...?

마찬가지로 맞춤법부터 검사해 준다.

엄청난 시간이 걸리지만 더 나은 결과를 위해 비용을 지불하자.

이번에도 맞춤법 검사와 정규화를 함께 진행하겠다.

로블록스 리뷰에서 명사만 추출한 후 빈도 수는 아래와 같다.

로블록스 리뷰에 맞는 불용어를 설정하자.

# 불용어 설정
ro_stop_words = ['좀','제','것','거','때','이','정말','저','수','점','요','별','그','전','뭐','해','말','더',
              '분','번','게','내','해도','데','기','나','등','만','도','무','막','함','중','용','임','그거',
              '뭐','또','나','내','무','를','을','로','스','때','안']

불용어 제거를 완료한 후

달라진 빈도 수이다.

점수별 단어 빈도

로블록스는 5점 리뷰의 개수가 뚜렷하게 많다.

별점이 1점인 리뷰에는 5점과는 달리

계정, 로그인, 사람, 계속, 왜, 현질의 단어 빈도가 높았다.

상위 10개 단어 연관단어

별점 1점에 많이 등장한 단어인

'현질'과 연관된 단어인 용돈, 가격을 보면 유저의 입장에서 가격이 부담스럽다고 추측한다.

또 '계속'이라는 단어를 보면 앱 이용에 문제가 있다는 것을 알 수 있다.

반면 제페토와는 달리 '진짜' 라는 단어에는 긍정적인 연관 단어들도 많이 나왔다.

가까이 있는 단어 시각화

제페토보다 리뷰의 개수가 많기 때문에 등장 단어의 수가 많아서

더 빽빽하게 보인다.

중앙과 좀 떨어져서 뭉쳐있는 곳을 보면

인터페이스에 대한 '조절', 조이스틱', '크기','저절로' 등이 뭉쳐져 있는데

유저 인터페이스에 개선이 필요하다고 추측할 수 있겠다.

결론

단어의 빈도와 연관 단어를 살펴봄으로써

유저들이 불편해 하는 부분을 알아 볼 수 있었다.

두 게임 모두 어플을 사용하는데 있어서, 끊김 현상과 실행 문제가 있는 것으로 보인다.


느낀점

제페토와 로블록스의 리뷰를 분석해 봤다.

맞춤법 검사를 하는데 많은 시간이 걸렸다.

또 단어를 시각화 하는 부분에서는 단어의 수가 많아서 효과적으로 표현이 안된것 같다.